对现实世界的高质量观​​察对于各种应用至关重要,包括生产小型场景的3D印刷复制品以及对大型基础设施进行检查。这些3D观察通常是通过从不同观点组合多个传感器测量结果来获得的。指导选择合适的视图被称为下一个最佳视图(NBV)计划问题。大多数NBV都使用刚性数据结构(例如表面网格或体素电网)进行测量的原因。这简化了下一个最佳视图选择,但可以在计算上昂贵,减少现实世界的保真度,并与最终数据处理一起选择下一个最佳视图。本文介绍了表面边缘资源管理器(请参阅),这是一种NBV方法,该方法直接从先前的传感器测量中选择了新的观测值,而无需刚性数据结构。请参阅使用测量密度,以提出下一个最佳视图,以增加观察到的表面不足的覆盖范围,同时避免潜在的遮挡。模拟实验的统计结果表明,与在小型和大型场景上评估的体积方法相比,SEE可以在更少的计算时间和传感器行进距离中获得更好的表面覆盖范围。现实世界实验证明了使用固定在机器人臂上的3D传感器自主观察鹿雕像。
translated by 谷歌翻译
多样性规划算法在单个搜索空间中找到各种不同的起点和目标之间的路径。它们旨在通过在计划查询中重复使用信息来有效地做到这一点。可以在搜索之前或期间计算此信息,并且通常包括有效路径的知识。使用已知的有效途径来解决单个计划查询要比找到全新的解决方案所花费的时间更少。这允许多算法(例如PRM*)在许多问题上胜过诸如RRT*之类的单个算法,但它们的相对性能取决于重复使用的信息。尽管如此,很少有多Qualery计划者明确地寻求最大程度地提高路径重复使用,因此,许多计划者并没有始终如一地超越单寻球替代方案。本文介绍了努力的通知路线图(EIRM*),这是一种几乎渐近的最佳多样性计划算法,明确优先考虑重复使用计算工作。 Eirm*使用非对称双向搜索来识别可能有助于解决单个计划查询的现有路径,然后使用此信息来订购其搜索并减少计算工作。这使其可以在经过测试的抽象和机器人多样性计划问题上的最新计划算法找到最高级别的初始解决方案。
translated by 谷歌翻译
最佳路径规划是在优化目标的起始和目标之间找到有效状态的问题。知情路径规划算法顺序他们的搜索与特定于问题的知识表达为启发式,并且可以比未表现算法更有效的数量级。启发式最有效的是,当他们准确且计算地廉价才能评估,但这些通常是矛盾的特征。这使得适当的启发式难以满足许多问题。本文提出了两个几乎肯定的渐近最优采样的路径规划算法,以解决这一挑战,自适应地通知的树木(AIT *)和精力知的树木(EIT *)。这些算法使用非对称双向搜索,其中两个搜索彼此连续通知。这允许AIT *和EIT *通过同时计算和利用越来越准确,特定于问题的启发式来改善规划性能。 AIT *和EIT *相对于其他基于样品的算法的好处是在优化路径长度和障碍物间隙的十二个问题上进行了十二个问题。实验表明,AIT *和EIT *优于优化障碍物清除的问题的其他算法,其中先验成本启发式往往是无效的,并且仍然对最小化路径长度的问题表现良好,这种启发式通常是有效的。
translated by 谷歌翻译
This project leverages advances in multi-agent reinforcement learning (MARL) to improve the efficiency and flexibility of order-picking systems for commercial warehouses. We envision a warehouse of the future in which dozens of mobile robots and human pickers work together to collect and deliver items within the warehouse. The fundamental problem we tackle, called the order-picking problem, is how these worker agents must coordinate their movement and actions in the warehouse to maximise performance (e.g. order throughput) under given resource constraints. Established industry methods using heuristic approaches require large engineering efforts to optimise for innately variable warehouse configurations. In contrast, the MARL framework can be flexibly applied to any warehouse configuration (e.g. size, layout, number/types of workers, item replenishment frequency) and the agents learn via a process of trial-and-error how to optimally cooperate with one another. This paper details the current status of the R&D effort initiated by Dematic and the University of Edinburgh towards a general-purpose and scalable MARL solution for the order-picking problem in realistic warehouses.
translated by 谷歌翻译
平行操纵器的配置歧管比串行操纵器表现出更多的非线性。从定性上讲,它们可以看到额外的褶皱。通过将这种歧管投射到工程相关性的空间上,例如输出工作区或输入执行器空间,这些折叠式的边缘呈现出表现非滑动行为的边缘。例如,在五杆链接的全局工作空间边界内显示了几个局部工作空间边界,这些边界仅限于该机制的某些输出模式。当专门研究这些投影而不是配置歧管本身时,这种边界的存在在输入和输出投影中都表现出来。特别是,非对称平行操纵器的设计已被其输入和输出空间中的外来投影所困扰。在本文中,我们用半径图表示配置空间,然后通过使用同型延续来量化传输质量来解决每个边缘。然后,我们采用图路径计划器来近似于避免传输质量区域的配置点之间的大地测量。我们的方法会自动生成能够在非邻居输出模式之间过渡的路径,该运动涉及示波多个工作空间边界(局部,全局或两者)。我们将技术应用于两个非对称五杆示例,这些示例表明如何通过切换输出模式来选择工作空间的传输属性和其他特征。
translated by 谷歌翻译
与LTE网络相比,5G的愿景在于提供较高的数据速率,低延迟(为了实现近实时应用程序),大大增加了基站容量以及用户的接近完美服务质量(QoS)。为了提供此类服务,5G系统将支持LTE,NR,NR-U和Wi-Fi等访问技术的各种组合。每种无线电访问技术(RAT)都提供不同类型的访问,这些访问应在用户中对其进行最佳分配和管理。除了资源管理外,5G系统还将支持双重连接服务。因此,网络的编排对于系统经理在旧式访问技术方面来说是一个更困难的问题。在本文中,我们提出了一种基于联合元学习(FML)的大鼠分配算法,该算法使RAN Intelligent Controller(RIC)能够更快地适应动态变化的环境。我们设计了一个包含LTE和5G NR服务技术的模拟环境。在模拟中,我们的目标是在传输的截止日期内满足UE需求,以提供更高的QoS值。我们将提出的算法与单个RL试剂,爬行动物算法和基于规则的启发式方法进行了比较。仿真结果表明,提出的FML方法分别在第一部部署回合21%和12%时达到了较高的缓存率。此外,在比较方法中,提出的方法最快地适应了新任务和环境。
translated by 谷歌翻译
随着Covid-19在世界范围内的传播,需要快速,精确的自动分诊机制,以减少人类的努力,例如用于基于图像的诊断。尽管文献在这个方向上显示出了有希望的努力,但报告的结果并未考虑在不同情况下获得的CT扫描的可变性,因此,渲染模型不适合使用,例如使用例如使用例如不同的扫描仪技术。虽然现在可以使用PCR测试有效地进行COVID-19诊断,但该用例却例证了一种方法来克服数据可变性问题以使医疗图像分析模型更广泛地适用。在本文中,我们使用COVID-19诊断的示例明确解决了可变性问题,并提出了一种新颖的生成方法,旨在消除例如成像技术同时通过利用深度自动编码器的想法来同时引入CT扫描的最小变化。拟议的预性架构(PrepNet)(i)在多个CT扫描数据集上共同训练,(ii)能够提取改进的判别特征以改善诊断。三个公共数据集(SARS-COVID-2,UCSD COVID-CT,MOSMED)的实验结果表明,我们的模型将交叉数据集的概括提高了高达$ 11.84 $ $的百分比,尽管数据集绩效中的情况略有下降。
translated by 谷歌翻译
我们介绍了一种考虑复杂的环境条件,在极地地区介绍了一种在极地地区长距离海上路线计划的方法。该方法允许构建优化的路线,描述了该过程的三个主要阶段:使用不均匀网格对环境条件进行离散建模,网格最佳路径的构建以及路径平滑。为了说明不同的车辆性能,我们构建了一系列数据驱动的功能,这些功能可以应用于环境网格,以确定给定容器和网格单元的速度限制和燃料要求,以图形和地理空间表示这些数量。在描述我们的结果时,我们展示了一个示例用途,用于Polar Research船RRS David Attenborough爵士(SDA)的路线规划,核算冰的性能特征,并验证韦德尔海地区的时空路线构建,南极洲。我们通过证明路线的变化取决于季节性海冰可变性,所使用的路线规划目标函数的差异以及其他环境条件(如电流)的存在来证明这种路线构建方法的多功能性。为了证明我们的方法的普遍性,我们在北极海洋和波罗的海中介绍了例子。本手稿中概述的技术是通用的,因此可以应用于具有不同特征的血管。我们的方法不仅可以拥有一个船只计划程序,而且我们概述了该工作流程如何适用于更广泛的社区,例如商业和乘客运输。
translated by 谷歌翻译
我们研究了离线加强学习(RL)的代表性学习,重点是离线政策评估(OPE)的重要任务。最近的工作表明,与监督的学习相反,Q功能的可实现性不足以学习。样品效率OPE的两个足够条件是Bellman的完整性和覆盖范围。先前的工作通常假设给出满足这些条件的表示形式,结果大多是理论上的。在这项工作中,我们提出了BCRL,该BCRL直接从数据中吸取了近似线性的贝尔曼完整表示,并具有良好的覆盖范围。通过这种学识渊博的表示,我们使用最小平方策略评估(LSPE)执行OPE,并在我们学习的表示中具有线性函数。我们提出了端到端的理论分析,表明我们的两阶段算法享有多项式样本复杂性,该算法在所考虑的丰富类别中提供了一些表示形式,这是线性的贝尔曼完成。从经验上讲,我们广泛评估了我们的DeepMind Control Suite的具有挑战性的基于图像的连续控制任务。我们显示我们的表示能够与针对非政策RL开发的先前表示的学习方法(例如Curl,SPR)相比,可以更好地使用OPE。 BCRL使用最先进的方法拟合Q评估(FQE)实现竞争性OPE误差,并在评估超出初始状态分布的评估时击败FQE。我们的消融表明,我们方法的线性铃铛完整和覆盖范围都至关重要。
translated by 谷歌翻译
近年来,在诸如denoing,压缩感应,介入和超分辨率等反问题中使用深度学习方法的使用取得了重大进展。尽管这种作品主要是由实践算法和实验驱动的,但它也引起了各种有趣的理论问题。在本文中,我们调查了这一作品中一些突出的理论发展,尤其是生成先验,未经训练的神经网络先验和展开算法。除了总结这些主题中的现有结果外,我们还强调了一些持续的挑战和开放问题。
translated by 谷歌翻译